コンテンツセキュリティ管理
コンテンツセキュリティ管理のエントリーポイントは以下の通りです:
禁止用語管理
禁止用語管理機能は、ユーザーがプラットフォーム上のコンテンツを効果的にコントロールし、コンテンツのコンプライアンスや健全性を確保し、企業内部規定やコミュニティ管理規範に準拠するのに役立ちます。禁止用語を定義することで、システムはコンテンツの生成、表示、保存の段階でインテリジェントに識別・ブロックを行い、センシティブな情報の拡散を防ぎます。
機能の特長
- 一括インポート・エクスポート対応、大量の禁止用語を集中管理しやすい
- 柔軟なステータス制御、各禁止用語ごとに個別で有効化・無効化が可能
- 説明情報のサポート、禁止用語の設定背景や用途を記録しやすい
- インポートテンプレートの検証機能、フォーマットエラーや重複項目のインポートを防止
禁止用語の新規追加
ユーザーは手動で1件または複数の禁止用語を追加できます。操作手順は以下の通りです:
- パスに移動:
内容安全管理 > 敏感词 > 新建
- ポップアップウィンドウで以下の情報を入力:
- 禁止用語:例
恐怖
- 有効状態:
启用
または停用
を選択 - 説明(任意):禁止用語追加の背景を補足
- 禁止用語:例
- 保存をクリックすると、禁止用語は即時有効化または保留(有効状態による)
インポートテンプレートのダウンロード
禁止用語を一括管理しやすくするため、システムは統一されたインポートテンプレートを提供しています。操作は以下の通りです:
- パスに移動:
内容安全管理 > 敏感词 > 下载模板
- システムが自動的にExcelファイルをダウンロードします。デフォルト名:
敏感词导入模板.xlsx
- テンプレートファイルを開き、以下の項目を入力:
敏感词
(必須)是否启用
(是 / 否)描述
(任意)
- 入力後、ファイルを保存しインポート用に準備
禁止用語のインポート
禁止用語テンプレートの準備ができたら、一括インポートを行います:
- パスに移動:
内容安全管理 > 敏感词 > 导入
- アップロードエリアをクリック、またはテンプレートファイルをドラッグ&ドロップでアップロード
- システムが内容(項目の完全性、フォーマット、重複など)を自動検証
- インポート成功後、「アップロード成功」メッセージが表示され、リストに新規禁止用語が表示されます
⚠️ まずは少量でテストし、フォーマットが正しいことを確認してから一括インポートすることを推奨します
禁止用語のエクスポート
現在プラットフォーム上のすべての禁止用語をExcelファイルとしてエクスポートできます。操作手順は以下の通りです:
- パスに移動:
内容安全管理 > 敏感词 > 导出
- エクスポートをクリックすると、システムが自動的に
.xlsx
ファイルをダウンロードします。デフォルト名:敏感词报表.xlsx
- レポート内容には禁止用語本体、有効状態、説明情報が含まれ、記録や共有に便利です
コンテンツ審査モデル
信頼度(Confidence)は、モデルやシステムがその予測結果にどれだけ自信を持っているかを示す指標です。
コンテンツ審査モデルの文脈では、信頼度の閾値設定は重要な機能であり、ユーザーがモデルが特定カテゴリ(スパム、不適切コンテンツなど)としてコンテンツをマークする前に必要な最低信頼度レベルを定義できます。これにより、閾値の設定に応じて誤検出や見逃しの数を減らすことができます。
例えば、信頼度の閾値を0.8
に設定した場合、モデルが予測結果に80%以上の自信を持っている場合のみ、そのコンテンツを不適切としてマークします。これにより、モデルが非常に確信しているケースのみがアクション対象となることを保証できます。